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PCT 

ER VORLAOFIGER PRUFUWG 
(Artikel 36 und Regel 70 PCT) 



AUF DEM 




Aktenzeichen des Anmelders oder Anwalts 
GR 97P2935P 


siehe Mtttetlung uber die Ubersendung des internationalen 
WEITERES VORGEHE^S vorlaufigen Prufungsbericht (Formblatt PCT/IPEA/416) 


Internationales Aktenzeichen 
PCT/DE98/03366 


Internationales Anrr\e\6e6aium(Tag/Monat/Jahr) 
16/11/1998 


Prioritatsdatum (Tag/Monat/Tag) 
21/11/1997 


Internationale Patentklassiflcation (IPK) oder nationate Klassifikation und IPK 
G10L5/06 


Anmelder 

SIEMENS AKTIENGESELLSCHAFT et al. 



1 . Dieser internationale vorlaufige Prufungsbericht wurde von der nnit der internationale vorlaufigen Prufung beauftragte 
Behorde erstellt und wird dem Anmelder gemaB Artikel 36 ubermittelt. 

2. Dieser BERICHT umfaRt insgesannt 5 Blatter einschlieBlich dieses Deckblatts. 

S Au3erdem liegen dem Bericht ANLAGEN bei; dabei handelt es sich um Blatter mit Beschreibungen, Anspruchen 
und/oder Zeichnungen, die geandert wurden und diesem Bericht zugrunde liegen, und/oder Blatter mit vor dieser 
Behorde vorgenommenen Berichtigungen (siehe Regel 70.16 und Abschnitt 607 der Venwaltungsrichtlinien zum PCT). 

Diese Aniagen umfassen insgesamt 2 Blatter. 



3. Dieser Bericht enthalt Angaben zu folgenden Punkten: 



Grundlage des Berichts 



II 


□ 


III 


□ 


IV 


□ 


V 




VI 




VII 




VIII 


□ 



gewerbltche Anwendbarkeit; Unterlagen und Erklarungen zur Stutzung dieser Feststellung 

Bestimmte angefuhrte Unterlagen 

Bestimmte Mangel der internationalen Anmeldung 



Datum der Einreichung des Antrags 
29/04/1999 


Datum der Fertigstellung dieses Berichts 

1 I 10. 59 


Name und Postanschrift der mit der internationalen vorlaufigen 
Prufung beauftragten Behorde: 

Europaisches Patentamt 
/flSj D-80298 Munchen 

Tel. +49 89 2399 - 0 Tx: 523656 epmu d 

Fax: +49 89 2399 - 4465 


Bevoltmachtigter Bediensteter y^^S^^;^;^ 
DeVos.L 1 3 1 

Tel. Nr. +49 89 2399 2048 — 



Formblatt PCT/IPE A/409 (Deckblatt) (Januar 1994) 



BNTERMATIONALER VORLAUFIGER 

PRUFUNGSBERIICHT Internationales Aktenzeichen PCT/DE98/03366 



I. Grundlage des Berichts 

1 . Dieser Bericht wurde ersteilt auf der Grundlage (Ersatzblatter, die dem Anmeldeamt auf eine Aufforderung nach 
Artikel 14 hin vorgelegt warden, gelten im Rahmen dieses Berichts als "ursprunglich eingereicht" and sind ihm 
nicht beigefugt, weil sie keine Anderungen enthalten.): 

Beschreibung, Seiteh: 

1-14 ursprungliche Fassung 

Patentanspruche, Nr.: 

1 -1 1 eingegangen am 30/09/1 999 mit Schreiben vom 29/09/1 999 

Zeichnungen, Blatter: 

1/4-4/4 ursprungliche Fassung 



2. Aufgrund der Anderungen sind folgende Unteriagen fortgefallen: 

□ Beschreibung, Seiten: 

H Anspruche, Nr.: 12 

□ Zeichnungen, Blatt: 

3. □ Dieser Bericht ist ohne Berucksichtigung (von einigen) der Anderungen ersteilt worden, da diese aus den 

angegebenen Grunden nach Auffassung der Behorde uber den Offenbarungsgehalt in der ursprunglich 
eingereichten Fassung hinausgehen (Regel 70.2(c)): 



4. Etwaige zusatzliche Bemerkungen: 



V. Begrundete Feststellung nach Artikel 35(2) hinsichtlich der Neuheit, der erfinderischen Tatlgkeit und der 
gewerblichen Anwendbarkelt; Unteriagen und Erklarungen zur Stutzung dieser Feststellung 

1 . Feststellung 

Neuheit (N) Ja: Anspruche 1-11- 

Nein: Anspruche 

Erfinderische Tatigkeit (ET) Ja: Anspruche 1-11 

Nein: Anspruche 

Gewerbliche Anwendbarkelt (GA) Ja: Anspruche 1-11 

Nein: Anspruche 
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2. Unterlagen und Erklarungen 
siehe Beiblatt 

VI. Bestimmte angef uhrte Unterlagen 

1 . Bestimmte veroffentlichte Unterlagen (Regel 70.10) 
und / Oder 

2. Nicht-schriftliche Offenbarungen (Regel 70.9) 
siehe Beiblatt 

VII. Bestimmte Mangel der internattonalen Anmeldung 

Es wurde festgestellt, daf3 die intemationale Anmeldung nach Form oder Inhalt folgende Mangel aufweist: 
siehe Beiblatt 
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V. BegirOimdete Festtsttelllyinig oach AoH. 35(2) PCT 

Die vorliegende Anmeldung befaBt sich mit Verfahren und Vorrichtungen zur 
Spracherkennung. 

Damit die fur die Ausfuhrung einer Spracherkennung benotigte Rechenleistung 
reduziert werden kann, ist in den vergangenen Jahren eine Reihe von IViaBnahmen 
vorgestellt worden, welche jedoch alle auch die erreichbare Erkennungsrate ungiinstig 
beeinflussen. 

Im Stand der Technik, z.B. dargestellt in Niemoller et. al., "A PC-based Real-Time 
Large Vocabulary Continuous Speech Recognizer for German", ICASSP 1997, wird 
stets ein bestimmtes System vorgestellt. Dies kann dazu fuhren, daB der Anwender 
eine mehr als ausreichende Genauigkeit der Spracherkennung eriangt, dafur aber 
keinen Echtzeitbetrieb der Spracherkennung, weil diese Spracherkennung fiir die hohe 
Erkennungsgenauigkeit zu viel Rechenleistung braucht. Umgekehrt kann es ebenfalls 
vorkommen, daB die vorhandene Rechenkapazitat nicht vollstandig ausgenutzt wird, 
dafur aber auch keine ausreichende Erkennungsgenauigkeit geliefert werden kann. 

Das technische Problem kann somit definiert werden als eine Anpassung der fiir die 
Spracherkennung venA/endeten Rechenkapazitat (und somit der erreichbaren 
Erkennungsrate) an die zur Verfugung gestellte Rechenleistung. 

Dieses Problem wird durch den unabhangigen Verfahrensanspruch und durch den 
unabhangigen Vorrichtungsanspruch folgendermaBen gelost: 

Es wird ein Leistungsindex bestimmt, der die fur die Spracherkennung zur Verfugung 
gestellte Rechenleistung widerspiegelt. Ausgehend von diesem Leistungsindex wird 
dann eine EingangsgroBe bestimmt, aus welcher eine passende Kombination von 
Systemparametern abgeleitet wird. Mit der so abgeleiteten Kombination von 
Systemparametern stimmt dann eine bestimmte Erkennungsrate der Spracherkennung 
uberein. 

Die unabhangigen Anspruche sind neu im Vergleich zum Stand der Technik. Sie 
beruhen auf einer erfinderischen Tatigkeit, da sich im Stand der Technik keine 
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Hinweise darauf finden lassen, welche den Fachkundigen dazu veranlaBten, die 
Genauigkeit einer Spracherkennung, bzw. die fur eine Spracherkennung benotigten 
Ressourcen, an die vom Rechner zur Verfugung gestellten Rechenleistung anpassen 
zu wollen. 

Aus diesem Grund sind die unabhangigen Anspruche 1 und 1 1 neu und beruhen sie 
auf einer erfinderischen Tatigkeit im Sinne des Artikels 33(2)-(3) PCT. 

Da die sich auf den unabhangigen Anspruch 1 beziehenden abhangigen Anspruche 2- 
10 nicht mit Anspruch 1 im Widerspruch stehen, gilt fur die Anspruche 2-10 ebenfalls, 
da3 sie neu sind und auf einer erfinderischen Tatigkeit im Sinne des Artikels 33(2)-(3) 
PCT beruhen. 



VI. BestDinniinnlte aimgefohirtG UoitGirllageo 

Bei der Prufung der vorliegenden internationalen Anmeldung ist davon ausgegangen 
worden, daB die vom Anmelder beanspruchte Prioritat gultig ist. 

In diesem Fall muB dann das im Internationalen Recherchenbericht zitierte Dokument 
W098/22936 bei der Prufung nicht in Betracht gezogen werden. 

Das Dokument W098/22936 enthalt jedoch nach Ansicht des Prufers keine 
Informationen, die fur die Prufung der vorliegenden Anmeldung mit ihren momentan 
gultigen Anspruchen nach Art. 33 PCT relevant waren. 

vm. Bestommlte Maingel 

Die Merkmale der Anspruche sind nicht mit in Klammern gesetzten Bezugszeichen 
versehen worden, obwohl Bezugszeichen in der vorliegenden Anmeldung ein 
wesentlich schnelieres Verstandnis der Anspruche ermoglichen wurden (Regel 6.2 b) 
PCT). 
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Patentanspruche 

1. Verfahren zur Spracherkennung, 

bei dem gesprochene Sprache anhand eines 
Spracherkennungssystems erkannt wird, wobei 

a) das Spracherkennungssystem auf einem Rechner ablauft; 

b) durch ein Programm zu einer Leistungsermittlung ein 
Leistungsindex des Rechners bestiinint wird; 

c) anhand des Leistungsindex eine Eingangsgroiie fur das 
Spracherkennungssystem automatisch bestiiniut wird; 

d) mit Hilfe dieser Eingangsgrofle die Genauigkeit des 
Spracherkennungssystems automatisch auf die ermittelte 
Leistung des Rechners eingestellt wird. 

2. Verfahren nach Anspruch 1, 

bei dem die Werte fiir die Systemparameter des 
Spracherkennungssystems bestimmt werden, indem gemaJJ 
einer Abbildungsvorschrif t aus der Eingangsgroiie die 
Werte ermittelt werden. 

3. Verfahren nach Anspruch 2, 

bei dem die Abbildungsvorschrif t anhand einer Tabelle 
umgesetzt wird. 

4. Verfahren nach einem der vorhergehenden Anspruche, 
bei dem die Einstellung wahrend des Betriebs des 
Spracherkennungssystems durchgefiihrt wird. 

5. Verfahren nach einem der vorhergehenden Anspriiche, 

bei dem das Spracherkennungssystem mindestens einen der 
folgenden Systemparameter umfafit: 

a) Pruning-Schwelle ; 

b) Histogramm-Pruning; - 

c) akustische Vorausschau; 

d) Vorausschau im Sprachmodell ; 

e) Schwelle zur Auswahl zu berechnender Distanzparameter . 
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Verfahren nach Anspruch 5, 

bei dem mindestens einer der Systemparameter anhand der 
Eingangsgrofie bestiimnt wird. 

Verfahren nach Anspruch 6, 

bei dem die Systemparameter gewichtet werden hinsichtlich 
ihres Einflusses auf jeweils eine Zielgrofie. 

Verfahren nach Anspruch 7, 

bei dem eine ZielgroJie mindestens eine der folgenden 
Groiien ist: 

a) Genauigkeit des Spracherkennungssystems ; 

b) Geschwindigkeit des Spracherkennungssystems. 

Verfahren nach Anspruch 7 oder 8, 

bei dem die Systemparameter gleich gewichtet werden. 

Verfahren nach Anspruch 7 oder 8, 

bei dem die Systemparameter entsprechend einer 

vorgegebenen Gewichtungstabelle gewichtet werden. 

Vorrichtung zur Spracherkennung, 

a) bei der ein Spracherkennungssystem vorgesehen ist; 

b) bei der ein Mittel zur Einstellung einer Genauigkeit 
des Spracherkennungssystems vorgesehen ist, das derart 
eingerichtet ist, dafl Systemparameter des 
Spracherkennungssystems einstellbar sind, wobei die 
Systemparameter anhand einer EingangsgroBe ermittelbar 
sind; 

c) bei der eine Einrichtung zur Leistungsmessung 
vorgesehen ist, die derart eingerichtet ist, daii die 
EingangsgroJie automatisch bestimmbar ist. 
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1. This international preliminary examination report has been prepared by this International Preliminary Examining 
Authority and is transmitted to the applicant according to Article 36. 



2. This REPORT consists of a total of 



. sheets, including this cover sheet. 



This report is also accompanied by ANNEXES, i.e., sheets of the description, claims and/or drawings which have 
been amended and are the basis for this report and/or sheets containing rectifications made before this Authority 
(see Rule 70.16 and Section 607 of the Administrative Instructions under the PCT). 

These annexes consist of a total of 2 sheets. 



3. This report contains indications relating to the following items: 
Basis of the report 
Priority 

Non-establishment of opinion with regard to novelty, inventive step and industrial applicability 
Lack of unity of invention 

Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 

Certain documents cited 

Certain defects in the international application 

Certain observations on the international application 



I 




II 


□ 


III 


□ 


IV 


□ 


V 




VI 




VII 




VIII 


□ 



Date of submission of the demand 

29 April 1999 (29.04.99) 


Date of completion of this report 

11 October 1999(11.10.1999) 


Name and mailing address of the IPEA/EP 
Facsimile No. 


Authorized officer 
Telephone No. 



Form PCT/IPEA/409 (cover sheet) (January 1994) 



# Mr 

:]lMinary examination report 



national application No. 

INTERNATIONAL PRELlflfNARY EXAMINATION REPORT PCT/DE98/03366 



I. Basis of the report 



1 . This report has been drawn on the basis of (Replacement sheets which have been furnished to the receiving Office in response to an invitation 
under Article 14 are referred to in this report as "originally filed" and are not annexed to the report since they do not contain amendments.): 

I I the international application as originally filed. 

the description, pages ^"^^ , as originally filed, 

pages , filed with the demand, 

pages , filed with the letter of , . 



pages , filed with the letter of 



the claims, Nos. , as originally filed, 

Nos. » as amended under Article 19, 

Nos. , filed with the demand, 

Nos. IJJ , filed with the letter of 29 September 1999 (29.09.1999^ 

Nos. , filed with the letter of 



^ the drawings, sheets/fig \/4-4/4 ^ as originally filed, 

sheets/fig , filed with the demand, 

sheets/fig , filed with the letter of 

sheets/fig , filed with the letter of 

2. The amendments have resulted in the cancellation of: 

□ 

the description, pages 



LaJ the claims, Nos. 12_ 

□ 

the drawings, sheets/fig 



3 rn This report has been established as if (some of) the amendments had not been made, since they have been considered 
— to go beyond the disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)). 



4. Additional observations, if necessary: 
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V. Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 



1 . Statement 

Novelty (N) 

Inventive step (IS) 
Industrial applicability (lA) 



Claims 
Claims 

Claims 
Claims 

Claims 
Claims 



1-11 



1-11 



1-11 



YES 
NO 
YES 
NO 

YES 
NO 



Citations and explanations 



See Supplemental Sheet 
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Intejgational ^plication No. 
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VIL Certain defects in the international application 



The following defects in the form or contents of the international application have been noted: 



See Supplemental Sheet 
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Supplemental Box 

(To be used when the space in any of the preceding boxes is not sufficient) 



Continuation of: V, VI and VII: 



Box V 



The present application concerns voice recognition 
methods and devices. 

In recent years, a number of measures aimed at reducing 
the computing power required for voice recognition have 
been described. All these also have an adverse effect on 
the recognition rate achievable, however. 

The prior art, e.g. as represented by Niemoller et al, "A 
PC-Based Real-Time Large Vocabulary Continuous Speech 
Recognizer for German", ICASSP 1997, always describes a 
specific system. This may mean that, while the user 
achieves a more than adequate level of voice recognition 
accuracy, voice recognition cannot be carried out in 
real-time mode. The reason is that too much computing 
power is required for a high level of accuracy in this 
voice recognition mode. The reverse may be true, however, 
namely that the computing capacity available is not fully 
utilized but, at the same time, an adequate level of 
voice recognition accuracy cannot be provided. 

The technical problem can therefore be defined as an 
adjustment of the computing powex— used for voice 
recognition (and therefore of the recognition rate 
achievable) to the computing power available. 

This problem is solved by the independent method claim 
and the independent device claim as follows. 
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Supplemental Box 

(To be used vAien the space in any of the preceding boxes is not sufficient) 

Continuation of: V, VI and VII: 

A performance index is specified to reflect the computing 
power available for voice recognition. This performance 
index is then used to specify an input variable, from 
which a suitable combination of system parameters is 
derived. A specific voice recognition rate then 
corresponds to the combination of system parameters so 
derived. 

The independent claims are novel over the prior art. They 
also involve an inventive step, since none of the prior 
art appears to give a skilled person any inducement to 
adjust voice recognition accuracy, or the resources 
required for voice recognition, to the computing power 
made available by the computer. 

Independent Claims 1 and 11 are therefore novel and 
involve an inventive step (PCT Article 33(2) and (3)). 

Dependent Claims 2 to 10, which refer back to independent 
Claim 1, do not conflict with Claim 1. They are therefore 
likewise novel and involve an inventive step (PCT 
Article 33 (2) and (3) ) . 



The examination of the present international application 
was based on the assumption that the priority claimed by 
the Applicant is valid. 



Box VI 
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Supplemental Box 
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Continuation of: V, VI and VII: 



WO-A-98/22936, which was cited in the international 
search report/ does not therefore need to be considered 
in the examination . 

In any case, in the Examiner's view, WO-A-98/22936 does 
not contain any information of potential relevance for 
examination of the present application, with the claims 
as currently valid, under PCT Article 33. 



Box VII 

The features of the claims have not been provided with 
reference signs placed between parentheses although, in 
the present application, reference signs would render the 
claims much more readily intelligible (PCT Rule 6.2(b)). 
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Patent Claims 

1 . Method for voice recognition, 

in which spoken language is recognized using a voice recognition system, whereby 
5 [sic] 

a) in which the voice recognition system runs on a computer; 

b) in which a performance index of the computer is determined by a program for 
computer performance assessment; 

c) in which the input quantity for the voice recognition system is automatically 

1 0 specified using the performance index, whereby a computing power of the computer is 
automatically adjusted to the accuracy of the voice recognition system. 

2. Method as claimed in claim 1, 

in which the values for the system parameters of the voice recognition system are 
1 5 determined in that the values are computed from the input quantity in accordance with 
a mapping specification. 

3. Method as claimed in claim 2, 

in which the mapping specification is converted using a table. 

20 

4. Method as claimed in one of the preceding claims, 

in which the setting process is executed during the operation of the voice recognition 
system. 

2 5 5, Method as claimed in one of the preceding claims, 

in which the voice recognition system comprises at least one of the following system 
parameters: 

a) pruning threshold; 

b) histogram pruning; 




14 

c) acoustic look-ahead; 

d) language model look-ahead; 

e) threshold for selecting distance parameters that are to be computed. 

5 6. Method as claimed in claim 5, 

in which at least one of the system parameters is specified using the input quantity. 

7. Method as claimed in claim 6, 

in which the system parameters are weighted with respect to their influence on a 
1 0 respective target quantity . 

8. Method as claimed in claim 7, 

in which a target quantity is at least one of the following quantities: 

a) accuracy of the voice recognition system; 
15 b) speed of the voice recognition system. 

9. Method as claimed in claim 7 or 8, 

in which the system parameters are weighted equally. 

2 0 10. Method as claimed in claim 7 or 8, 

in which the system parameters are weighted according to a prescribed weighting 
table. 

1 1 . Device for voice recognition, 
2 5 a) in which a voice recognition system is provided, 

b) in which means are provided for adjusting an accuracy of the voice recognition 
system, said means being so arranged that system parameters of the voice recognition 
system are adjustable, said system parameters being computable using an input 
quantity. 



m 



15 

12. Device as claimed in claim 11, 

with a means for measuring performance, which is so arranged that the input quantity 
can be specified automatically. 



1 
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Abstract 

Method and Device for Voice Recognition 

5 A method and a device are set forth which make it possible to set an accuracy in a 
voice recognition process. To this end, system parameters of the voice recognition 
system are determined using an input quantity via a mapping specification, and the 
voice recognition system is set corresponding to the obtained values. Optionally, a 
voice recognition system can be adapted during operation, in order to guarantee an 

10 application-specific adaptation in a range between maximal quality in the voice 

recognition and optimally high speed in the execution of the voice recognition. The 
computer can also be set automatically in that a performance index of the computer 
has been determined in advance using a program provided for this purpose, which 
index represents a measure for the input quantity and thus guarantees an adequate 

15 operation of the voice recognition system on this computer. 
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Beschreibung 

Verfahren und Vorrichtung zur Spracherkennung 

Die Erfindung betrifft ein Verfahren und eine Vorrichtung zur 
Spracherkennung. 

Ein Spracherkennungssystem ist aus [1] bekannt. Dort finden 
sich auch eine grundlegende Einfiihrung der an dem 
Spracherkennungssystem beteiligten Komponenten sowie 
wichtiger, bei der Spracherkennung tiblicher Techniken. 

Bei einem bekannten Spracherkennungssystem ist eine 
Genauigkeit, also ein Mali ftir eine Qualitat der Erkennung, 
vorgegeben. Der Benutzer muB nun mit diesem System auskommen, 
auch wenn ftir seine Anwendung eine verminderte Genauigkeit 
ausreichen, dafUr er aber eine hohere 
Bearbeitungsgeschwindigkeit erzielen wurde. 

Das Prinzip des Pruning eines Suchraums ist aus [2] (siehe 
Kapitel 3.3.3, Seite 40) bekannt. Dabei handelt es sich um 
ein "Beschneiden" des Suchraums, also eine Methode zur 
Reduzierung einer Anzahl von Suchpfaden des Suchraiams, wobei 
diejenigen Suchpfade abgeschnitten werden, die wenig 
aussichtsreich sind. Zuerst wird dazu ein Suchpfad mit 
minimalen Kosten (optimaler Suchpfad) ermittelt. Daraufhin 
werden alle Suchpfade (Aste des Suchbaums) weggeschnitten, 
deren Kosten oberhalb des Minimums zuzuglich einer addierten 
vorgegebenen BewertungsgroBe, die als Pruning-Schwelle 
bezeichnet wird, liegen. Fur eine detaillierte Erklarung des 
Prunings: [2], Seite 40ff., insbesondere Bild 16 auf 
Seite 41. 

Bei Verwendung der Pruning-Schwelle ist nicht bekannt, 
wieviel Suchpfade in dem Suchbaum Ubrig bleiben. Will man die 
Anzahl dieser ubrigbleibenden Suchpfade auf einem 
vorgegebenen Niveau halten, wird die Pruning-Schwelle 
dynamisch angepaBt . 



2 

Ein Histogramm-Pruning ist aus [3] oder [4] bekannt* Hier 
werden eine vorgegebene Anzahl "bester" Suchpfade, also 
Suchpfade mit einer hohen Auf trittswahrscheinlichkeit , 
verwendet, indem Haufigkeiten der Suchpfade in Form eines 
Histogramms bewertet werden. Die Pruning-Schwelle wird 
dynamisch verandert. 

Eine akustische Vorausschau im Suchbaum (Fachwort: Fast-Look- 
Ahead) ist aus [5] Oder [6] bekannt. 

Die bei der akustischen Vorausschau (auch schnelle 
Vorauswahl) verfolgte Idee beruht auf der Eigenschaft einer 
Sprache, daJi sich alle Worter aus einem beschrankten Inventar 
von Unterworteinheiten (z.B. Phonemen, Halbsilben) 
zusammensetzen. Fiir diese Unterworteinheiten wird nun "im 
Voraus" eine akustische Bewertung durchgef iihrt . Es werden nur 
diejenigen Kombination von Unterworteinheiten weiterverf olgt , 
deren akustische Bewertungen jeweils unterhalb einer 
vorgegebenen Schwelle liegen. Ein Gewinn im Bewertungsauf wand 
besteht darin, dali fiir eine geringe Anzahl von Unterwort- 
einheiten ein Mali fiir die Ubereinstimmung eines zu 
erkennenden Sprachsignals mit einer Zielgrofie im voraus 
berechnet und als Grundlage fiir eine Entscheidung 
herangezogen wird, ob ein Grofiteil des Suchbaxams nicht weiter 
beriicksichtigt werden soli. Anschaulich gesprochen bedeutet 
dies, dali mehr Suchpfade im Suchbaum eingespart werden, als 
durch die Vorausberechnung hinzukommen. Ein derartiger Gewinn 
wird umso groBer, je hoher das Verhaltnis von neuen 
Wortanfangen zu einer Anzahl von Unterworteinheiten wird. 
Dieses Verhaltnis steigt mit der Anzahl. der zu erkennenden 
Unterworteinheiten bzw. Worter (Lexikongrolie) . 

Ein Vorteil des Verfahrens der akustischen Vorausschau 
besteht in der Regularitat der Algorithmen zur Berechnung der 
entsprechenden Maiie. Da keine Verzweigungen durch Wortenden, 
Syntaxknoten, etc, im Suchraum auftreten, ist das Schema der 
Berechnung der Malie regular. Gerade deshalb bietet sich ein 
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solches Verfahren auch fiir eine Imp lementie rung in Hardware 
an . 



Die Vorausberechnung der Mafie (Fachwort: Fast-Match-Scores) 
5 wird dadurch moglich, daii die eigentliche Suche xim eine feste 
Anzahl von Zeitfenstern hinter den aktuellen extrahierten 
Mafien des Sprachsignals hinterhereilt . Mit den aktuellen 
Malien wird die Vorausberechnung der Mafle weiterer 
Unterworteinheiten durchgefuhrt (siehe [5], Seite 65, Bild 
10 33) . 

Auch in Sprachmodellen ist die Durchfuhrung einer derartigen 
Vorausschau bekannt (siehe [6]), 

Das Prinzip der Vorausschau iiti Sprachmodell (Fachwort: 

15 Language-Model-Look-Ahead) ist die Berticksichtigung der iin 
Sprachmodell vorhandenen Wahrscheinlichkeiten in dem 
Suchprozeli so friih wie moglich, auch in dem assoziierten 
Pruning. Dies wird erreicht durch eine Faktorisierung der 
Wahrscheinlichkeiten im Sprachmodell, Eine detaillierte 

20 Beschreibung mit einer formalen Notation ist in [6] 
enthalten . 

Schlielilich ist z.B, aus [7] eine Schwelle zur Auswahl 
berechnender Distanzparameter bekannt. Derartige 

25 Auswahlverf ahren sind generell mehrstufig angelegt. Zuerst 
wird eine grobe Berechnung mit einem Teil der Distanzen 
durchgefuhrt. Im nachsten Schritt werden dann diejenigen 
Distanzen bestimmt, die bezuglich eines Abstandsmalies nahe an 
der besten Distanz des ersten Berechnungsschrittes liegen. 

30 Dieses Abstandsmafi kann liber eine Schwelle variiert werden, 
wodurch der Berechnungsauf wand fur die Bestimmung der 
Distanzparameter variiert wird. 

Die Auf gabe der Erfindung besteht darin, ein Verfahren und 
35 eine Vorrichtung zur Einstellung der Genauigkeit des 
Spracherkennungssystems zu schaf f en , 
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Dieses Aufgabe wird gemaii den Merkmalen der unabhangigen 
Patentanspruche gelost . 

Es wird ein Verfahren zur Einstellung einer Genauigkeit eines 
Spracherkennungssystems angegeben, bei dem durch eine 
vorgebbare EingangsgroJie die Genauigkeit bestiitimt wird. 
Anhand dieser Eingangsgroiie werden Werte fiir Systemparameter 
des Spracherkennungssystems, vorzugsweise mittels eines 
Rechners, ermittelt. Anhand dieser Werte wird das 
Spracherkennungssystem eingestellt. Dies geschieht 
vorzugsweise autoitiatisch durch den Rechner. 

Somit ist es ein Vorteil der Erfindung, die Genauigkeit des 
Spracherkennungssystems adaptierbar und zugleich fur den 
Laien einstellbar zu machen. Je nach Anwendung bzw. je nach 
Rechenleistung, die fur das Spracherkennungssystem auf dem 
Rechner bereitsteht, konnen unterschiedliche Anf orderungen an 
die Qualitat des Spracherkennungssystems einfach durch 
Adaption der Eingangsgrofie vorgenommen werden. 

Eine Weiterbildung besteht darin, dafi gemaii einer 
Abbildungsvorschrif t aus der EingangsgroiJe die Werte fiir die 
Systemparameter des Spracherkennungssystems ermittelt werden. 
Dabei kann diese Abbildungsvorschrif t anhand einer Tabelle 
umgesetzt sein. 

Es ist also moglich, durch Einstellung der Eingangsgrolie 
automatisch die damit verkntipften Werte der Systemparameter 
des Spracherkennungssystems zu ermitteln und automatisch dem 
Spracherkennungssystem zuganglich zu machen. Das Ablegen der 
Werte in einer Tabelle hat den Vorteil, dal5 eine individuelle 
Anpassung verschiedener Werte der Eingangsgrolie zu jeweils 
verschiedenen Werten der Systemparameter durchgefuhrt werden 
kann. 

Eine andere Weiterbildung besteht darin, die Einstellung 
wahrend des Betriebs des Spracherkennungssystems 
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durchzufuhren. Dabei ergibt sich vorteilhaft, dali die 
Anpassung des Spracherkennungssystems individuell nach den 
jeweiligen Anf orderungen wahrend des Betriebs des 
Spracherkennungssystems angepaiit werden kann, 

Eine zusatzliche Weiterbildung der Erfindung besteht darin, 
dali mindestens einer der folgenden Systemparameter anhand de 
Eingangsgroiie bestimmt wird: 

a) Pruning-Schwelle; 

b) Hi stogramm- Pruning; 

c) akustische Vorausschau; 

d) Vorausschau im Sprachmodell ; 

e) Schwelle zur Auswahl zu berechniender Distanzparameter 

Zur Bedeutung und Funktion dieser Systemparameter wird auf 
die Einleitung verwiesen. 

Die angefuhrten Systemparameter stellen eine Auswahl von 
Moglichkeiten dar. Es sind andere Systemparameter 
vorstellbar, die, abhangig von dem jeweiligen 
Spracherkennungssystem, von den oben genannten verschieden 
sein konnen. 

Auch ist es eine Weiterbildung der Erfindung, daJ5 die 
Systemparameter hinsichtlich ihres Einflusses auf eine 
Zielgrolie hin gewichtet werden. Dabei kann die ZielgroBe 
beispielsweise eine Genauigkeit des Spracherkennungssystems 
Oder eine Geschwindigkeit des Spracherkennungssystems (also 
die Geschwindigkeit zur Durchftihrung des 
Spracherkennungsprozesses) sein. Im Hinblick auf die 
jeweilige Zielgrolie konnen die Systemparameter anteilig 
gleich oder entsprechend einer vorgegebenen 
Gewichtungstabelle unterschiedlich gewichtet werden. 

Im Rahmen einer anderen Weiterbildung wird die Eingangsgroiie 
anhand eines Einstellelements bestimmt. 
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Vorzugsweise weist das Einstellelement einen eindimensionalen 
Freiheitsgrad mit zwei Begrenzungen auf, wobei die erste 
Begrenzung als maximale Genauigkeit des 
Spracherkennungssystems und die zweite Begrenzung als 
5 maximale Geschwindigkeit des Spracherkennungssystems 
\imgesetzt werden. 

Auch ist es eine Weiterbildung des Verfahrens, dali das 
Einstellelement auf einem Rechner als ein Schieberegler 
10 dargestellt wird und anhand einer Tastatur, eines Touch-Pads 
Oder einer Maus bedient wird. 

) 

Auch kann das Einstellelement ein Drehregler, -ein 
Schieberegler oder Potentiometer sein. 

15 

In einer zusatzlichen Weiterbildung wird das Einstellelement 
liber Sprache angesteuert, die von einem Spracherkenner , 
insbesondere dem Spracherkennungssystem, ausgewertet wird. 
Die EingangsgroBe kann mittels Spracheingabe bestimmt werden. 

20 

Das Verfahren wird auch weitergebildet , indem eine 
vollstandig automatisierte Bestimmung der Eingangsgroiie in 
den folgenden Schritten durchgefuhrt wird: 

Eine Leistungsf ahigkeit des Rechners, auf dem das 
^ 25 Spracherkennungssystem ablaufen soil, wird anhand eines 
Programms zur Leistungsermi ttlung bestimmt und als ein 
Leistungsindex abgespeichert . Unter Beriicksichtigung des 
Leistungsindex werden die Systemparameter des 
Spracherkennungssystems automatisch eingestellt und dadurch 

30 wird eine leistungsf ahige Spracherkennung unter z.B. 
Echtzeitbedingung gewahrleistet . 

Ein Programm zur Bestimmung der Leistungsf ahigkeit des 
Rechners kann eine vorgegebene Schleife sein, die eine 
bestimmte Anzahl Iterationen durchlauft, wobei die Zeit fiir 

35 die Iterationen gemessen wird. Anhand einer Tabelle kann 

abhangig von der gemessenen Zeit der Leistungsindex bestimmt 
werden- Auch gibt es kommerziell oder als Freeware verfugbare 
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Prograinine, die die Leistungsf ahigkeit des Rechners ermitteln 
und als eine BewertungsgroBe der Leistungsf ahigkeit einen 
Leistungsindex ausgeben. 

Auch wird eine Vorrichtung zur Spracherkennung angegeben, die 
ein Spracherkennungssystem aufweist und mit einem Mittel zur 
Einstellung einer Genauigkeit des Spracherkennungssystems 
ausgefuhrt ist, welches Mittel Systemparameter des 
Spracherkennungssystem aus einer Eingangsgrofle umsetzt, also 
die Einstellung des Spracherkennungssystems und seiner 
zahlreichen Systemparameter anhand der Eingangsgrofie 
vornimmt. 

Dabei ist es vorteilhaft, daJi eine solche Einstellung der 
Systemparameter anhand der EingangsgroJie wahrend des Betriebs 
des Spracherkennungssystems erfolgen kann. So wird fiir den 
Benutzer eine einfache Anpassung der Vielzahl von 
Systemparametern moglich. 

Die EingangsgroBe ist in einer Weiterbildung automatisch 
bestimmbar. Dazu wird anhand einer Einrichtung zur 
Leistungsmessung des Rechners, auf dem das 
Spracherkennungssystem ablauft, ein sog. Leistungsindex 
ermittelt und zur Einstellung der Genauigkeit des 
Spracherkennungssystems benutzt . 

Eine andere Weiterbildung sieht vor, dafi die Eingangsgrblie 
durch ein Einstellelement vorgebbar ist. Dazu sind eine 
Vielzahl moglicher Einstellemente (Potentiometer, virtuelle 
S teuereinheiten auf dem Rechner, etc.) denkbar, deren 
Einstellung direkt die Genauigkeit des 
Spracherkennungssystems bestimmt . 

Vorteilhaft konnen Schritte des er f indungsgemafien Verfahrens 
auf der angegebenen Vorrichtung durchgefuhrt werden. 
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Weiterbildungen der Erfindung ergeben sich auch aus den 
abhangigen Anspriichen. 

Anhand der folgenden Figuren werden Ausf uhrungsbeispiele der 
Erfindung naher dargestellt. 

Es zeigen 

Fig-1 eine Systemarchitektur fur ein 
Spracherkennungs system; 

Fig. 2 ein Blockdiagrainin mit Schritten eines Verfahrens zur 
Einstellung der Genauigkeit eines 
Spracherkennungssys terns; 

Fig. 3 ein Blockdiagramm, das eine Verkntlpfung einer 

Eingangsgroiie mit mindestens einem Systemparameter 
tiber eine Abbildungsvorschrif t darstellt; 

Fig. 4 ein Diagraima, das verschiedene mogliche 

Systemparameter des Spracherkennungs systems 
darstellt; 

Fig. 5 eine Skizze, die den Einflufi der Systemparameter auf 
eine ZielgroBe darstellt; 

Fig. 6 ein Diagramm, das verschiedene Moglichkeiten zur 
Einstellung der Eingangsgrolie darstellt; 

Fig. 7 ein Spracherkennungssystem mit einem Mittel zur 
Einstellung der Genauigkeit. 

In Fig. 1 ist allgemein eine Systemarchitektur fiir eine 
Spracherkennung (Spracherkennungssystem) dargestellt . 



Vorausset zung fiir die Erkennung natiirlich gesprochener 
Sprache ist ein geeigneter Formalismus zur 
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Wissensreprasentation . Ein vollstandiges 

Spracherkennungssystem umfalit mehrere Verarbeitungsebenen. 
Dies sind insbesondere Akustik-Phonetik, Intonation, Syntax, 
Semantik und Pragmatik. In Fig.l werden die 
Verarbeitungsebenen bei der Erkennung auf gezeigt . 

Das naturliche Sprachsignal 101 gelangt in das 
Spracherkennungssystem. Dort wird in einer Komponente 102 
eine Merkmalsextraktion durchgef uhrt . Nach der 
Merkmalsextraktion werden anhand bekannter akustisch- 
phonetischer Einheiten 103 Sprachlaute erkannt (siehe Block 
104) . Dabei handelt es sich urn die Berechnung akustischer 
Distanzparameter . Nach der Sprachlauterkennung 104 erfolgt 
die lexikalische Decodierung (Worterkennung) in einem Block 
106 mit Hilfe des Aussprachemodells bzw, Wortlexikons 105 und 
daran anschlieBend eine Syntaxanalyse 108 mit Hilfe des 
Sprachmodells, das die Grammatik umfalit, 107. Die 
Worterkennung 106 und die Syntaxanalyse 108 stellen die Suche 
nach einer Entsprechung fiir das Sprachsignal dar. Schlielilich 
wird in einem Block 110 eine semantische Nachbearbeitung 
durchgef uhrt , wobei Kontextwissen und Pragmatik 109 
berucksichtigt werden und schliefilich die vom 
Spracherkennungssystem erkannte Sprache 111 folgt. 

In Fig , 2 ist ein Blockdiagramm dargestellt, das Schritte 
eines Verfahrens zur Einstellung der Genauigkeit eines 
Spracherkennungssystems zeigt. 

In einem Schritt 201 wird durch eine vorgebbare EingangsgroBe 
die Genauigkeit des Spracherkennungssystems bestimmt. 
Daraufhin wird in einem Schritt 202 anhand dieser 
Eingangsgrofie fiir Systemparameter des Spracherkennungssystems 
Werte ermittelt. Schlieiilich wird in einem Schritt 203 das 
Spracherkennungssystem anhand der ermittelten Werte 
eingestellt . 
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Fig. 3 zeigt ein Blockdiagramm, das eine Verkniipfung einer 
Eingangsgrolie iiber eine Abbildungsvorschrif t mit mindestens 
einem Systemparameter darstellt. 

Die erwahnte Eingangsgrolie 301 wird anhand einer 
Abbildungsvorschrif t 302 auf die Systemparameter SP 303 des 
Spracherkennungssystems abgebildet. Dabei wird vorzugsweise 
eine Eingangsgrolie 301 mehreren Systemparametern uber die 
Abbildungsvorschrif t zugeordnet. Durch diese 
Abbildungsvorschrif t 302 wird durch Vorgabe einer 
Eingangsgrolie das Spracherkennungssystem angepaiit, also 
werden mehrere Systemparameter SP durch Veranderung einer 
Eingangsgrolie 301 beeinflulit. Die Abbildungsvorschrif t 302 
hat vorzugsweise die Form einer Tabelle, in der eine Spalte 
mogliche Eingangsgrolien 301 enthalt, und in einer Zeile 
dieser Spalte der jeweiligen Eingangsgrolie mehrere Werte fiir 
Systemparameter SP 303 zugeordnet werden. Die 
Abbildungsvorschrif t 302 besteht im Suchen nach dem der 
Eingangsgrofie 301 zugeordneten Eintrag (Zeile) in der Tabelle 
und in der Obergabe der gefundenen Werte fur Systemparameter 
SP 303 an das Spracherkennungssystem. 

Fig. 4 zeigt ein Diagramm, das verschiedene mogliche 
Systemparameter des Spracherkennungssystems darstellt. Die 
Systemparameter SP des Spracherkennungssystems, dargestellt 
in einem Block 401, umfassen mindestens einen der folgenden 
Parameter : 

a) Pruning-Schwelle 402; 

b) Histogramm-Pruning 403; 

c) akustische Vorausschau 404; 

d) Vorausschaum im Sprachmodell 4 05; 

e) Schwelle fiir Distanzparameter 406. 

Insgesamt sind weitere Systemparameter des 
Spracherkennungssystems zur Einstellung uber die 
Eingangsgrolie 301 denkbar, angedeutet durch den Block 407. 
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Fig, 5 zeigt eine Skizze, die den EinfluB der Systemparameter 
auf eine Zielgrolie darstellt. 

Die Systemparameter SP (siehe Block 501) nehmen Einfluii auf 
eine Zielgroiie ZG (siehe Block 502) . Wie oben beschrieben, 
gibt es mehrere Systemparameter SPl, SP2, usw . , dargestellt 
in einem Block 503. Dabei nimmt jeder einzelne 
Systemparameter SPi (i=l,2,...) mittels eines fur den 
jeweiligen Systemparameter SPi vorgesehenen Gewichts Gi 
(dargestellt in einem Block 504) Einfluii auf die Zielgrolie 
ZG. Durch die Gewichtung der Systemparameter SP ist es 
moglich, je nach Systemparameter SP einen unterschiedlichen. 
EinfluB auf die Zielgrolie ZG zu nehmen. 

In Fig. 6 ist ein Diagramm dargestellt, das verschiedene 
Moglichkeiten zur Einstellung der Eingangsgrolie zeigt. Die 
Einstellung der Eingangsgrolie, dargestellt in dem Block 601, 
erfolgt anhand von Bedienkomponenten des Rechners R (siehe 
Block 602) , anhand von Regelungskomponenten 603 oder anhand 
des Rechners selbst (siehe Block 604) . Der Rechner R umfaiit 
dazu mindestens ein Mittel zur Einstellung der Eingangsgrolie, 
wie eine Tastatur 605, eine Maus 606, ein Touch-Pad 607 oder 
Spracheingabe 608 uber das Spracherkennungssystem. Mogliche 
Komponenten zur Regelung, dargestellt in dem Block 603 sind 
ein Drehregler 609, ein Schieberegler 610 oder ein sonstiger 
Regler 611, vorzugsweise ein Potentiometer. Zusatzlich wird 
automatisch anhand eines Programms, das auf deia Rechner 
lauft, die Rechenleistung des Rechners ermittelt und die 
Eingangsgrolie zur Einstellung des Spracherkennungssystems 
entsprechend bestimmt. Dadurch wird gewahrleis tet , dali ein 
automatisch eingestellter Rechner eine seiner Rechenleistung 
entsprechende Qualitat bei der Spracherkennung gewahrleistet . 
Automatisch wird ein Kompromili gefunden zwischen hoher 
Qualitat bei der Spracherkennung, unter Einbulie von 
Rechenleistung bzw. Echtzeiterkennung der Sprache, und 
schneller Spracherkennung mit entsprechend wenig Bedarf an 
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Rechenleistung allerdings deutlicher Qualitatseinbufie bei der 
Spracherkennung . 

Fig. 7 zeigt eine Vorrichtung aus einem Spracherkennungssystem 
701 und einem Mittel zur Einstellung der Genauigkeit des 
Spracherkennungssystems 702. 

Anhand des Mittels zur Einstellung der Genauigkeit 702 sind 
durch eine Eingangsgroiie Systemparameter des 
Spracherkennungssystems bestimmt. Dazu wird die 
Eingangsgroiie, vorzugsweise anhand einer vorgegebenen 
Tabel.le, einer Vielzahl von Systemparametern (Pruning- 
Schwelle, Histogramm-Pruning, akustische Vorausschau, 
-VoraussGhau im Sprachmodell, Schwelle zur Auswahl zu 
berechnender Distanzparameter , etc..) zugeordnet . 

Die Eingangsgroiie ist wahlweise anhand eines Einstellelements 
703 Oder einer Einrichtung zur Leistungsbestimmung des 
Rechners 704 bestimmbar. Hierbei sei auch auf Fig. 6 und die 
dort angegebenen Moglichkeiten zur Einstellung der 
Eingangsgroiie verwiesen . 
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Im Rahmen dieses Dokuments wurden folgende Verof f entlichungen 
zitiert : 

[1] A. Hauenstein; "Optimierung von Algorithinen und Entwurf 
eines Prozessors fiir die automat ische Spracherkennung" , 
Lehrstuhl fur Inte.grierte Schaltungen, Technische 
Universitat Munchen, Dissertation, 19,07.1993, Kapitel 2, 
Seiten 13 bis 26.. 

[2] A. Hauenstein: "Optimierung von Algorithmen und Entwurf 
eines Prozessors fiir die automatische Spracherkennung" , 
Lehrstuhl fur Integrierte Schaltungen, Technische 
Universitat Munchen, Dissertation/ 19.07.1993, Kapitel 
3.3.3, Seiten 40 bis 43. 

[3] Volker Steinbiss, Bach-Hiep Tran, Hermann Ney: 

"Improvements in Beam Search. Proc. Intl. Conf. Speech 
and Language Processing, Yokohama 1994, Seiten 2143 bis 
2146, 

[4] M, Niemoller, A. Hauenstein, E. Marschall, P. Witschel, 
U. Harke: "A PC-based Real-Time Large Vocabulary 
Continuous Speech Recognizer for German", Proc. IEEE 
Intl. Conf. on Acoustics, Speech and Signal Processing; 
Munchen 1997. 

[5] A. Hauenstein: "Optimierung von Algorithmen und Entwurf 
eines Prozessors fur die automatische Spracherkennung", 
Lehrstuhl fur Integrierte Schaltungen, Technische 
Universitat Munchen, Dissertation, 19.07.1993, Kapitel 
3.5.1, Seiten 65 bis 69, 

[6] S. Ortmanns, A. Eiden, H, Ney, N, Coenen: "Look-Ahead 

Techniques for Fast Beam Search", Proc. IEEE Intl. Conf. 
on Acoustics, Speech and Signal Processing; Munchen 1997, 
Seiten 1783 bis 1786. 

[7] E. Bocchieri: "Vector Quantization for the Efficient 
Computation of Continuous Density Likelihoods", Proc. 
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IEEE Intl. Conf. on Acoustics, Speech and Signal 
Processing; 1993, Seiten 11-692 bis 11-695. 
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Patent anspruche 

1. Verfahren zur Spracherkennung, 

bei dem gesprochene Sprache anhand eines 
5 Spracherkennungssystems erkannt wird, wobei 

a) bei dem das Spracherkennungssystem auf einem Rechner 
ablauft; 

b) bei dem durch ein Programm zu einer 
Leistungsermittlung des Rechners ein Leistungsindex 

10 des Rechners bestimmt wird; 

c) bei dem die EingangsgroBe fiir das 
Spracherkennungssystem automatisch anhand des 
Leistungsindex bestimmt wird, wobei dabei eine 
Rechenleistung des Rechners automatisch auf die 

15 Genauigkeit des Spracherkennungssystems eingestellt 

wird, 

2. Verfahren nach Anspruch 1, 

bei dem die Werte ftir die Systemparameter des 
2 0 Spracherkennungssystems bestimmt werden, indem gemali 

einer Abbildungsvorschrif t aus der EingangsgroBe die 
Werte ermittelt werden. 

3. Verfahren nach Anspruch 2, 

25 bei dem die Abbildungsvorschrif t anhand einer Tabelle 

umgesetzt wird. 

4. Verfahren nach einem der vorhergehenden Anspruche, 
bei dem die Einstellung wahrend des Betriebs des 

30 Spracherkennungssystems durchgefuhrt wird. 

5. Verfahren nach einem der vorhergehenden Anspruche, 

bei dem das Spracherkennungssystem mindestens einen der 
folgenden Systemparameter umfaBt: 
35 a) Pruning-Schwelle; 

b) Hi stogramm- Pruning; 

c) akustische Vorausschau; 
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d) Vorausschau iiri Sprachmodell ; 

e) Schwelle zur Auswahl zu berechnender Distanzparameter . 

6. Verfahren nach Anspruch 5, 

5 bei dem mindestens einer der Systemparameter anhand der 

Eingangsgrofie bestimmt wird. 

7. Verfahren nach Anspruch 6, 

bei dem die Systemparameter gewichtet werdeh hinsichtlich 
10 ihres Einflusses auf jeweils eine Zielgroiie. 

8. Verfahren nach Anspruch 1, 

bei dem eine Zielgrolie mindestens eine der folgenden 
GroBen ist: 

15 a) Genauigkeit des Spracherkennungssystems ; 

b) Geschwindigkeit des Spracherkennungssystems. 

9. Verfahren nach Anspruch 7 oder 8, 

bei dem die Systemparameter gleich gewichtet werden. 



10. Verfahren nach Anspruch 7 oder 8, 

bei dem die Systemparameter entsprechend einer 
vorgegebenen Gewichtungs tabelle gewichtet werden. 



11. Vorrichtung zur Spracherkennung, 

a) bei der ein Spracherkennungssys tern vorgesehen ist, 

b) bei der ein Mittel zur Einstellung einer Genauigkeit 
des Spracherkennungssystems vorgesehen ist, das derart 

30 eingerichtet ist, daii Systemparameter des 

Spracherkennungssystems einstellbar sind, wobei die 
Systemparameter anhand einer Eingangsgrofie ermittelbar 
sind. 
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12. Vorrichtung nach Anspruch 11, 

mit einer Einrichtung zur Leistungsmessung, die derart 
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eingerichtet ist, dafi die Eingangsgroiie automatisch 
bestimmbar ist. 
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Zusammenf assung 

Verfahren und Vorrichtung zur Spracherkennung 

5 Es werden ein Verfahren und eine Vorrichtung angegeben, die 
bei einer Spracherkennung eine Einstellung einer Genauigkeit 
eines Spracherkennungssystems ermoglichen . Dazu werden anhand 
einer Eingangsgrolie -ut^er eine Abbildungsvorschrif t 
Systemparameter des Spracherkennungssystems ermlttelt und das 

10 Spracherkennungssystem entsprechend der auf diese Art 

bestimmten Werte eingestellt. Optional kann eine Adaption 
eines Spracherkennungssystems wahrend des Betriebs erfolgen, 
um eine anwendungsabhangige Anpassung in einem Bereich 
zwischen maximaler Qualitat bei der Spracherkennung und 

15 moglichst hoher Geschwindigkeit bei ,der Durchfuhrung der 

Spracherkennung zu gewahrleisten . Auch kann automatisch der 
Rechner eingestellt werden, indem zuvor anhand eines dafur 
vorgesehenen Programmes ein Leistungsindex des Rechners 
bestimmt wurde, der ein Mali fiir die EingangsgroJie darstellt 

2 0 und somit einen adaqu^ten Betrieb des Spracherkennungssystems 
auf diesem Rechner gewahrleistet . 
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VERTRAGi 



;ER doe INTERNATIONALE ZUSfil 
V DEM GEBOET DES PATENTWWE 



i\/iENARBEIIT 
£NS 



INTERNATDONALER RECMERCHENBEROCMT 

(Artikel 18 sowie Regein 43 und 44 PCT) 



Aktenzeichen des Anmelders Oder Anwalts 
GR 97P2935P 


WEITERES siehe Mitteilung uber die Ubermittlung des internationaien 

Recherchenberichts (Formbtatt PCT/IS A/220) sowie, sowett 
VORGEHEN zutreffend, naciistehender Punkt 5 


Internationales Aktenzeichen 

PCT/DE 98/03366 


Internationales Anmeldedatum 
(Tag/Monat/Jahr) 

16/11/1998 


(FrQhestes) Prioritatsdatum (Tag/Monat/Jahr) 

21/11/1997 


Anmelder 

SIEMENS AKTIENGESELLSCHAFT et al , 



Dieser Internationale Recherchenbericht wurde von der Internationaien RecherchenbehOrde ersteilt und wird dem Anmelder gemaB 
Artikel 18 ubermittelt. Eine Kopie wird dem Internationaien Biiro ubermittelt. 

Dieser internationale Recherchenbericht umfaRt insgesamt _3 Blatter. 

[X] DarOber hinaus liegt ihm jeweils eine Kopie der in diesem Bericht genannten Unterlagen zum Stand der Technik bei. 



1 . Grundlage des Berichts 

a 



Hinsichtlich der Sprache ist die internationale Recherche auf der Grundlage der Internationaien Anmeldung in der Sprache 
durchgefCihrt worden, in der sie eingereicht wurde, sofern unter diesem Punkt nichts anderes angegeben ist. 



□ 



2. 
3. 



Die internationale Recherche ist auf der Grundlage einer bel der BehOrde eingereichten Ubersetzung der internationaien 
Anmeldung (Regel 23.1 b)) durchgefuhrt worden. 

Hinsichtlich der In der internationaien Anmeldung offenbarten Nucleotid- und/oder Aminosauresequenz ist die internationale 
Recherche auf der Grundlage des Sequenzprotokolls durchgefuhrt worden, das 
I I in der internationaien Anmeldung in Schriflicher Form enthalten ist. 

zusammen mit der internationaien Anmeldung In computerfesbarer Form eingereicht worden Ist. 

bei der Behorde nachtr^glich in schriftlicher Form eingereicht worden ist. 

bei der Behorde nachtrSglich in computerlesbarer Form eingereicht worden ist. 

Die Erklarung, daR das nachtrSglich eingereichte schriftliche Sequenzprotokoll nicht uber den Offenbarungsgehalt der 
internationaien Anmeldung im Anmeldezeitpunkt hinausgeht. wurde vorgelegt. 

I I Die Erklarung, dafl die in computerlesbarer Form erfaBten Informationen dem schriftlichen Sequenzprotokoll entsprechen, 
wurde vorgelegt. 

I I Bestlmmle Anspriiche haben sich als nIcht recherchierbar erwiesen (siehe Feld I). 
I I Mangelnde EInheltllchkeit der Erflndung (siehe Feld II). 



□ 

□ 
□ 
□ 



4. Hinsichtlich der Bezeichnung der Erfindung 

PC] wird der vom Anmelder eingereichte Wortlaut genehmigt. 
I I wurde der Wortlaut von der Behdrde wie folgt festgesetzt: 



Hinsichtlich der Zusammenfassung 

["^ wird der vom Anmelder eingereichte Wortlaut genehmigt. 

wurde der Wortlaut nach Regel 38.2b) in der in Feld III angegebenen Fassung von der BehOrde festgesetzt. Der 
[ ] Anmelder kann der Beh6rde innerhalb eines Monats nach dem Datum der Absendung dieses internationaien 

Recherchenberichts eine Stellungnahme vorlegen. 

Folgende Abbildung der Zelchnungen ist mit der Zusammenfassung zu verdffentlichen: Abb. Nr. 2 



[X] wie vom Anmelder vorgeschlagen keinederAbb. 
I I well der Anmelder selbst keine Abbildung vorgeschlagen hat. 
I I well diese Abbildung die Erfindung besser kennzeichnet. 
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nationales Aktenzeichen 

/DE 98/03366 



A. KLASSIFIZIERUNG DES ANMELDUNGSGEGENSTANDES 

IPK 6 G10L5/06 G10L3/00 



Nach der Internationalen Patent klassifrkation (IPK) oder nach der nationalen K lass ifi Ration und der IPK 



B. RECHERCHIERTE GEBIETE 



Recherchierter MIndestprOfstoff (Klassifikatlonssystem und Klassiflkationssymbole ) 

IPK 6 GIOL 



Recherchierte aber nicht zum MIndestprOfstoff gehdrende Veroffentllchungen, soweit dies© unterdie recherchterten Gebiete fallen 



Wahrend der internationalen Recherche konsuttierte elektronische Datenbank (Name der Datenbank und evtl. verwendete Suchbegriffe) 



C. ALS WESENTLICH ANGESEHENE UNTERLAGEN 



Kategorie° 


Bezelchnung der Veroffentlichung, soweit erforderllch unter Angabe der in Betracht kommenden Teile 


Betr. Anspnjch Nr. 


A 


us 5 682 464 A (SEJNOHA VLADIMIR) 


1,11,12 




28. Oktober 1997 




siehe Zusammenfassung; Anspruche 7,9 




p,x 


WO 98 22936 A (NETIX INC T) 28. Ma1 1998 


1,11 




siehe Selte 30, Zelle 7 - Zeile 21; 




Anspruche 8-12 
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Weitere Veroffentllchungen sind der Fortsetzung von Feld C zu 
entnehmen 



□ 



Siehe Anhang Patentfamilie 



* Besondere Kategorlen von angegebenen Verfiffentlichungen 
"A* Veroffentlichung, die den allgemeinen Stand der Technik definiert, 
aber nicht als besonders bedeutsam anzusehen ist 



alteres Dokument, das jedoch erst am oder nach dem internationalen 
Anmeldedatum verdffentlicht worden ist 



"L" Veroffentlichung, die geeignet ist, einen Prloritatsanspruch zweifelhaft er- 
scheinen zu lassen, oder durch die das Veroffentlichungsdatum einer 
anderen im Recherchenbericht genannten Veroffentlrchung belegt werden 
soil Oder die aus einem anderen besonderen Grund angegeben ist (wie 
ausgefQhrt) 

"O" Veroffentlichung, die sich auf eine mundliche Offenbarung, 

eine Benutzung, eine Ausstellung oderandere MafBnahmen bezieht 
"P" Veroffentlichung, die vor dem internationalen Anmeldedatum, aber nach 
dem beanspruchten Prioritatsdatum verSffentllcht worden ist 



Spate re VerSffentlichung, die nach dem internationalen Anmeldedatum 
Oder dem Prioritatsdatum veroffentlicht worden ist und mit der 
Anmeldung nicht kollidlert, sondern nur zum Verstandnis des der 
Erfindung zugrundeliegenden Prinzips oder der ihr zugrundeliegenden 
Theorie angegeben ist 

Vereffentlichung von besonderer Bedeutung; die beanspruchte Erfindung 
kann allein aufgnjnd dieser Veroffentlichung nicht als neu oder auf 
erflnderischer Tatigkeit beruhend betrachtet werden 

Verbffentlichung von besonderer Bedeutung; die beanspruchte Erfindung 
kann nicht als auf erflnderischer Tatigkeit beruhend betrachtet 
werden, wenn die Veroffentlichung mit einer oder mehreren anderen 
Verdffentlichungen dieser Kategorie in Vertjindung gebracht wird und 
diese Verbindung fur einen Fachmann naheliegend ist 

Veroffentlichung. die Mitglied derselben Patentfamilie ist 



Datum des Abschlusses der internationalen Recherche 

13. April 1999 


Absendedatum des internationalen Recherche nberichts 

20/04/1999 


Name und Postanschrtft der Internationalen Recherchenbeh6rde 
Europaisches Patentamit, P.B. 5818 Patentlaan 2 
ML - 2280 HV Rifswijk 
Tel. (-1-31-70) 340-2040. Tx. 31 651 epo nl, 
Fax: (+31-70) 340-3016 


BevollmSchtigter Bodiensteter 

Van Doremalen, J 
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INSTITUTE OF ELECTRICAL AND ELECTRONICS 

ENGINEERS 

slehe Absatz 5 

ORTMANNS S ET AL: "LOOK-AHEAD TECHNIQUES 
FOR FAST BEAM SEARCH" 
1997 IEEE INTERNATIONAL CONFERENCE ON 
ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 
SPEECH PROCESSING, DIGITAL SIGNAL 
PROCESSING MUNICH, APR. 21 - 24, 1997, 
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